记忆系统如何帮助解决问题

原文:Memory systems and problem-solving practice | Patreon

大部分有关记忆系统(助记系统)的讨论都存在一个问题:这个系统真正的目标,不是记住卡片上的答案,而是扩展你思考和付诸实践的能力。当然,你的 APP 会告诉你,你可以把这组卡片记得很牢,历经好几个月而不忘。但这对你真实的行动与思考意味着什么呢?其中的联系还不甚清晰。如果我们的目标是获得实际运用的能力,而不是死记硬背,那么对于记忆系统,应该如何使用、设计和重新定义呢?多年来,我一直想深入研究这些问题,但建立有效的实验环境相当困难 。令人高兴的是,这个月,我可以与一位学生合作,观察他如何迁移记忆系统中得来的知识,应用到解决复杂的问题上。

我一直在担任 Alex 的「个人学习助手」,他是一名成人学习者,正在学习物理,为了一个有意义的项目服务。我们每隔一天或两天就讨论他在学习过程中遇到的问题和取得的进展;我聆听他的辅导课程;我指导他应对遇到的挑战;并且我为可能有帮助的干预制作原型。这个月,Alex 一直在学习由 Young 和 Freedman 所著的经典教材中的静电学。我撰写了记忆卡片以加强内容的掌握——我们学过的每一章大约都有 70 张,涵盖了声明式、程序式和概念层面的材料。

然而,问题来了。在 Alex 阅读每一章并完成了几轮记忆练习之后,他仍然觉得课本的习题很困难。我敢肯定,记忆练习是有帮助的:在解决问题时,他能够凭记忆回忆起长长的方程式和定义。然而,仅仅通过详细的记忆练习,还不足以让他独立地解决复杂的习题。他的学习停滞不前,而且会犯显著的错误。

在解题上花了很多小时后,Alex 发现答题变得更容易了。在解决这些习题时,有一些重要的事情发生了,重要程度要超过他在读教科书,做精细记忆练习时发生的事情。当然,这背后的代价并不轻:我估计他在解题上花费的时间,至少是阅读和复习文本的四倍。

在某种程度上,这并不令人惊讶。当然,学某个主题时不能仅仅阅读相关内容。你甚至不能只回答一堆问题。你必须去实践这个主题。但在解决问题的过程中,在认知上发生了什么?我们能否安排某种有针对性的练习,以更有效或更高效地引起这些变化?对于那些没有现成问题集的主题,这意味着什么?还有:我们如何确保在此期间获得的任何见解,都能像通过记忆练习加强的其他材料一样能保持下去

迁移恰当的加工

我们可以从名为「迁移恰当加工」的理论中找到一组答案。这一理论认为,我们记住信息的能力,在某种程度上,取决于编码时的加工方式,与回忆时的加工方式,多大程度上是匹配的。仅仅练习回忆信息并不足够:练习中对信息的处理,应该与日后应用时的加工方式相同。

我在 Alex 身上亲眼目睹了类似的情况。他可以流畅地向我解释电场与电力之间的关系,但遇到个问题需要求出某个电场对某个电荷施加多少力,他却难以应用这一知识。当我演示了如何做到这一点时,他很快就理解了这与他刚刚给出的概念解释之间的联系。但是,这种联系是与解释本身分开的东西,而不是解释本身。

认知心理学家 Garrett O’Day [最近进行了一系列相关实验](http://andymatuschak.org/files/papers/O'Day - 2019 - Improving Problem Solving with Retrieval-Based Learning.pdf)。他旨在探讨迁移恰当加工对提取练习的影响,特别是在解决复杂问题的背景下。在一个实验中,他给本科生提供了关于泊松过程的简明教程。「练习」组需要测试回忆解决泊松过程问题的程序步骤,而与此同时「对照」组则阅读更多的例题。然后,他们被要求解决类似于他们所学习的问题。这种情况通常会引发「测试效应」——主动提取通常比被动重读产生更好的表现。但实际上并没有。这两个组的表现差不多——表现都很差。O’Day 进行了后续实验,其中「练习」组会重复解决类似的练习问题并接受反馈,而不仅仅是回忆过程步骤。这次,在一周后的后测中,练习组的表现明显优于对照组。

仅仅学习例题是不够的;复习过程步骤也不够。这两组在后测中的表现都很差。O’Day 的实验表明,要想提高解决问题方面的能力,你需要练习解决问题,最好是有反馈。从理论上讲,迁移恰当加工表明,你不需要解决问题本身;你只需要做一些练习,其中涉及了与问题类似的认知加工过程。我不确定这到底是什么。也许只需要设定一个问题,或者在解决问题的过程中采取某个「步骤」就足够了。目前,我还不知道有任何这方面的实验。

图式习得:提升解决问题的灵活性

O’Day 的研究结果强调了另一个挑战。如果测试问题与练习问题相似,练习会带来良好的表现。但是如果测试问题需要对过程进行小幅改动,表现就下降了。练习带来的收益没有得到迁移。

img

认知心理学家 Yeo 和 Fazio 在使用类似材料的几个实验中[观察到了类似的结果](http://andymatuschak.org/files/papers/Yeo, Fazio - 2019 - The optimal learning strategy depends on learning goals and processes2.pdf)。不过,他们还观察到另一个有趣的现象:在练习问题特别难(正确率 < 50%)的一个实验中,相比解决练习题,学生学习例题效果更好。然后,在后续实验中,当材料发生变化以在学习阶段提高问题解决能力时,测试效应又回来了。

Yeo 和 Fazio 提出,我们实际上观察到了多个过程在相互作用。一方面,学生需要将他们学到的东西转移到长期记忆中,并提升熟练度。练习和测试能支持这个目标。但要在测试中解决迁移问题,学生还需要将他们学到的东西进行泛化。文献将其称为「图式归纳」。[这种说法认为](http://andymatuschak.org/files/papers/Sweller - 1988 - Cognitive load during problem solving.pdf),当专家解决问题时,他们在很大程度上依赖图式,这些结构「使问题解决者能够将问题分类,化解为能够运用某些步骤解决的问题」。为了建立灵活的解决问题能力,你需要习得这些图式。这通常是通过归纳完成的——在一组问题中注意到模式,注意到某一组步骤似乎有所帮助。

另一位认知心理学家 John Sweller [提出](http://andymatuschak.org/files/papers/Sweller - 1988 - Cognitive load during problem solving.pdf),解决问题的练习存在重要的权衡。困难的问题可能会产生更强的记忆编码,但它们也会给你的工作记忆带来负担,产生「认知负荷」。结果,你可能在注意问题结构中的模式时,几乎没有剩余的容量来「获取图式」。

在 Yeo 和 Fazio 的第一个实验中,他们设置了相当困难的问题,而学习例题的学生,比解决习题的学生表现更好。作者们认为这是因为在阅读例题时,学生们遇到的认知负荷,要小于解决问题时。因此,这些读者有学习图式的脑容量余裕——尽管代价是他们更快地忘记了学到的东西。

在他们的第二个实验中,Yeo 和 Fazio 简化了问题,设置了具有相同表面特征的问题(只改变数字)。这有所帮助:练习解决问题的学生,比学习例题的学生表现更好。但他们的迁移表现很差,这是说得通的,因为他们练习了一堆相同的问题。学生们对练习问题所涉及的内容建立了持久的记忆,但他们没有获得通用的图式。

因此,在最后一个实验中,Yeo 和 Fazio 简化了习题,但让它们的表面特征各不相同。学生们的迁移表现得到了足够的改善,以至于与相同问题的表现之间不再存在统计学上显著的差异。作者们认为,这个实验的练习问题足够多样化,可以进行泛化,而认知负荷足够轻,使得图式获取成为可能。不幸的是,他们的实验并没有真正设计来测试这个特定的假设,因此我们目前只能进行跨实验比较。

这里的粗略含义与常识相符。图式获取和记忆至少在某种程度上是独立的。你可以注意到模式,但无法持久地记住;你可以强化解决问题的记忆,但这种强化很脆弱,无法迁移到不熟悉的问题上。认知心理学家经常谈论[合意困难](http://andymatuschak.org/files/papers/Bjork - 1994 - Memory and Metamemory.pdf)——产生更复杂加工的有益挣扎——但学生确实可能面临着[不合意困难](http://andymatuschak.org/files/papers/Chen et al - 2018 - Undesirable difficulty effects in the learning of high-element interactivity.pdf)。如果你想要灵活性和持久的流利,那么你应该沿着平缓的斜坡进行练习。你不想让你的工作记忆负担过重,以至于你的思维无法重新组织相关概念的表示。而且,在刚开始时,这通常意味着你最好仔细研究已解决的例子,而不是自己解决问题。简而言之(因为记忆当然与建立灵活性有关),你首先要能够解决问题,然后要建立流利度,以便长期解决问题。

我提到的所有论文都没有涉及保持问题——也就是说,在很长一段时间内持久地保持这种可迁移的解决问题的表现。我猜想一旦获得了这些灵活的图式,你可以通过普通的分散提取练习(译注:即间隔重复)来加强它们。正如我们在上一节中讨论的,你需要实际解决问题,而不仅仅是提取程序。也许你可以使用「友好数字」来设置问题,以便它们总是可以在你的头脑中轻松解决。为了加强这些灵活的图式,你需要每次都让问题有所变化。人们可能可以使用语言模型来生成这种相当好的变化,但实际上没有必要拥有一个真正无底的池子:如果练习广泛分散,你可能可以不必练习少量结构变化,特别是当数字随机生成时。

值得注意的是,此时我们正在接近智能辅导系统(ITS)的领域,这是教育技术研究的另一个分支。受到认知负荷理论的强烈启发,这些系统专注于针对理想目标,找出最顺滑的问题解决路径。这些系统更少考虑灵活运用和持久记忆这些目标,但思考如何将记忆系统与 ITS 技术相结合,或者如何调整 ITS 以支持灵活运用和持久记忆,这些方向很有趣。

知识吸收不完全

在前两小节中,我已经开始解释,在解决问题集过程中,认知上发生了什么,以及我们如何使其中一些活动更有效。但对于一些 Alex 遇到的困难,还有另一个简单的解释:Alex 实际上并没有完全理解教材所说的部分内容,而且他没有察觉到。

遗憾的是,练习并没有明确地揭示这些漏洞。如果有题目依赖没有理解的知识,这道题目只是让人感到困惑和困难,但这种感觉是模糊而无指向的。然而,在他的记忆练习的有声思维录像中,相当多的问题引起了类似这样的评论:「我记得答案是 X,但我不明白为什么」,或者「答案是 X ,我很奇怪。」举个例子,有个问题是:「如果你将装有质子的盒子在每个方向上的尺寸加倍,为什么电通量不会改变?」这个问题有很多合理的解法,但问题在于,所有解法 Alex 都理解不了。

对于这个问题和其他类似问题,我并没有试图帮助 Alex 产生新的理解或学习通用模式。这些问题实际上只是为了直接强化记忆。它们直接重述了文本中的一些重要解释,并使用了类似的措辞。如果 Alex 无法得出答案,但一旦他阅读解答,解答就立刻能让他理解,那么更多的提取练习可能会有所帮助。另一方面,如果答案没有意义,死记硬背并不是正确的解决办法。如果他不明白答案为何是这样的,那么他就没有理解我们试图强化的概念。仅仅记住答案没有多大意义。

这是一个重要的区别,需要理解,我担心这是记忆系统设计师一直忽略的一个问题:对于「错误」回答的适当干预,将因卡片的性质而有很大的不同。如果你忘记了你应该记住的东西,那么多次回顾它直到它牢记在心可能是可以的。如果你一开始就没有理解答案,那么你需要非常不同的干预。还有其他有意义的类别。如果问题是生成性任务(例如,「用五声音阶小调哼一段旋律」),你发现它太难了,你可能想浏览一些例子,或降低任务难度(例如,「为这个五声音阶小调旋律哼一个最后的小节」)。如果是解决问题的任务,你可能想阅读解决方案,然后添加关于重要模式或程序步骤的重点卡片。或者,采用 ITS 风格,你可能想阅读关于你的回答所暗示的误解的解释,然后将一些关注这个混淆的简单问题加入学习队列。

在 Alex 的情况下,我认为最合适的下一步干预就是简单地重新阅读教材中相关的段落。我不认为书中的解释难以理解;他在阅读这些段落时可能走神了。(我认为每个人或多或少会有这种情况,但我们通常没有察觉。)我已经将每张卡片直接链接到来源位置,所以从操作上来说,重新阅读相对容易,但实际上做起来会更困难。打断复习会话的顺畅进行,转而去阅读教材会让人感觉不好。此外,Alex 喜欢用手机复习,而在手机那个小屏幕上查看教材页面会非常不方便。因此,最好的办法是将这些问题标记下来,并建立一套在学习过程中处理这些问题的流程。如果书中的解释仍然无法理解,那么下一步可能就是一起讨论。或者,对于某些概念,最好暂时放一放,等到后面是否能理解。

《量子国度》中,我认为我们的设计对这种情况有所帮助。首先,你需要在阅读书籍的过程中复习每张卡片,而不是在记忆复习会话中进行复习。因此,如果你发现自己不理解某个答案,稍微向上滚动一点重新阅读即可,这样不会打断阅读流程。由于复习是在阅读中每隔几分钟进行的,相关的段落也不会离得太远。我们访谈的读者经常表示,他们在阅读时会有一种不寻常的自信,因为他们知道,穿插的复习会确保他们能吸收到他们「应该」学到的一切。

为什么我们没有使用像《量子国度》那样的设计来进行 Alex 的物理复习呢?首先,是因为他正在阅读一本纸质版的书!后来他换成了读数字版教科书。我已经实现了集成记忆卡片的 PDF 阅读器,但 PDF 渲染太闹心,我还没有实现文本中穿插复习。目前,卡片在边栏中显示,就像去年夏天的原型那样:

img

在这次讨论中,难以理解的记忆卡片扮演了不寻常但重要的角色。它们不再起到加强长期记忆的作用,而是充当防护网。这些卡片保证,如果你没有理解那部分文本,或者没有集中注意力,你就会重新注意到!我认为这非常有价值。通常情况下,你会尝试解决习题,结果因为有些重要概念没有理解而停滞不前,困惑不已。正如我之前提到的,问题在于你不清楚自己缺少什么。即使阅读例题,也不可能像我们一直在讨论的简单卡片那样,让遗漏的概念变得如此明显。

从交流中学习

费曼在《讲义》一书的引言中写道:

问题是个很好的机会,可以补充讲义材料的空白,让其中的概念更符合实际,更完整,记得更牢固。

然而,我认为,对于这个教育问题,除了意识到只有学生和一位优秀老师之间建立了直接的个人联系,才能开展最好的教学,别无他法。在这种情况下,学生可以讨论观点,思考并谈论知识。仅仅出席课堂,或者仅仅做一些指定的题目,是不可能学到很多东西的。

Alex 和我大约每周见面一次,共同讨论材料并一起解决问题。我不确定费曼的说法有多正确,但 Alex 告诉我,这些会议对他来说非常有价值。我认为这些会议并不能取代记忆系统的作用:为了更充分利用我们在一起的时间,我们没有复习基本原理,他也没有一直在查东西。而记忆系统确保我们取得的大部分进展都会得到巩固。

但我可以想象,在理想的世界里,Alex 在解决所有问题时,我都会在身边(或者更有效的辅导者)。这并不是作弊;我没有通过给出答案,简化他的工作。我让他努力,当他陷入困境时,我会提出探究性问题,这可能会帮助他突破困境。我可以在需要的地方提供原始信息。如果我发现误解指出,我可以提出问题以其引发有启发性的对话。我会提醒他注意可能遗漏的模式或联系。

这很难不让人开始思考:大型语言模型是否可以完成其中的一部分或全部工作?虽然我肯定利用了我丰富的物理和教育上的专业知识,但我不认为我做了什么特别的事情。足够好的模型,还可以帮助处理那些没有现成问题集和讨论题的主题。现在有六千亿个「AI 辅导员」创业公司在筹备中,但我还没看到路子走对的。我对我的抱怨没有明确的认识:过于教化,过于关注「正确答案」,对讨论和意义建构的兴趣不足。

我们合作解决问题的会议中有一个元素,我猜这些系统可能难以提供:社交能量。 Alex 非常有动力,也非常自律,但像我们所有人一样,他的精力有时高有时低。在某些日子里,很他难鼓起勇气去读另一章。但他发现,当我们一起学习时,他更容易对学习过程保持兴奋和激情。当与他人合作时,我也确实在……嗯,基本上是所有事情上都有过这种经历!

最后,我要指出的是,虽然在这篇文章中我提出了很多问题,但我对在这里学到的东西感到非常兴奋。这对我的研究来说是理想的环境。 Alex 非常有动力去深刻理解。这种理解面临很大的压力。他正在挣扎,所以有真正的增强机会。我可以亲眼目睹他的学习过程,有充分的干预机会,以及对我尝试的任何事情的紧密反馈。这是令人振奋的!现在我只需要大干一场。